无法简化生产工作流程,降低人工成本并加速创建内容,满足对高质量动画内容的不断增长的需求。在当前的动漫生产管道中,艺术家通常从定义角色视觉属性的角色设计表开始。然后将这些设计转换为关键帧草图 - 概述场景中主要姿势和动作的关键帧。接下来,艺术家创建了互动的草图,这是在关键框架之间绘制的框架,以定义详细的运动和过渡[41,65]。传统上,这些框架是彩色的,这是一项耗时的任务,涉及仔细注意以确保与原始角色设计保持一致。图2说明了该管道的每个步骤。我们的作品与这条管道无缝保持一致,旨在促进着色过程,同时保持对原始角色设计的保真度并确保跨帧的时间一致性。但是,自动化线条艺术色彩[28,59]提出了几个挑战。一个主要的困难在于角色设计与线条艺术草图之间的不匹配,在设计中,设计中的角度,比例和姿势可能与关键帧草图中的角度不符。此外,实现时间一致性至关重要;单独着色每个框架会导致闪烁或不一致,从而损害观看者的经验[5,32,64]。先前的方法[21,46,56]试图解决这些挑战,但要限制。他们经常假设钥匙扣的有色版本并依赖于密集的线条艺术指导。此假设大大增加了艺术家的工作量,因为它需要手动着色多个关键帧和详细的线条艺术输入,从而使过程变得乏味和劳动力密集。此外,某些方法由于训练管道而遭受颜色信息泄漏的影响。具体来说,他们使用使用神经网络从颜色图像中提取的非核心草图进行训练,无意中将原始图像的颜色信息无意识地转化为草图。此信息泄漏破坏了这些方法的实用性,因为现实世界的草图不包含这种隐式颜色信息,这是我们在方法论中进一步分析的关注。为了克服这些挑战,我们提出了一种新颖的全能模型,该模型简化了一个框架内的着色过程。我们的模型利用基于预处理扩散的视频生成模型[1,37],
主要关键词